搜索资源列表
Chinese-automatic-word-segmention
- 汉语自动分词和词性标注__源代码 这是原创,不带复制的 汉语自动分词和词性标注__源代码-Chinese automatic word segmentation and POS tagging __ source code This is the original, without copying Chinese automatic word segmentation and POS tagging __ source code
LTP
- 哈工大LTP自然语言处理工具的java调用实例,利用jni调用dll,实现中文的分词,词性标注,建立依存树等-HIT LTP natural language processing tool called an instance of java using jni call the dll, to achieve in Chinese word segmentation, POS tagging, the establishment of dependency trees, etc.
ICTCLAS_2009_API_DOC
- 计算所汉语词法分析系统ICTCLAS.分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其中中国人名的识别召回率接近98 处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。这是最新版的API接口文档,有详细的示例。-Calculation of the Chinese lexical analysis system ICTCLAS. Segmentati
ICTCLASAPIManual
- 中科院中文进行分词并对其词性标注;命名实体识别;新词识别;同时支持用户词典-Chinese Academy of Sciences Chinese word segmentation and POS tagging named entity recognition new word identification At the same time support the user dictionary
libsvm-2.89
- 该软件完成的是在linux下的分词,可以进行词性标注,可以用于中英文分析-The software is a complete linux under a sub-word, can be part of speech tagging can be used for analysis in Chinese and English
windows_csharp_32
- 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。ICTCLAS全部采用C/C++编写,支持Linux、FreeBSD及Windows系列操作系统,支持C/C++/C#/Delphi/Java等主流的开发语言
11111111
- 从一段文章中分词,标注词出现的次数,程序短小精练,有利于学习使用,谢谢!-Carved from a piece of writing words, mark the number of times the word appears, the program short and concise, is conducive to learning to use, thank you!
ctbparser_0.10.tar
- ctbparser是一个开源的中文句法分析工具包,用于分词、词性标注、依存句法分析-ctbparser is an open source Chinese parsing toolkit for Chinese word segmentation, POS tagging, dependency parsing
ctbparser_0.11.tar
- ctbparser是一个开源的中文句法分析工具包,用于分词、词性标注、依存句法分析-ctbparser is an open source Chinese parsing toolkit for Chinese word segmentation, POS tagging, dependency parsing
1998renminribaodaiyoucixingbiaozhu
- 语音合成训练用语料,分词并带有词性标注。文档性质不是源码。-TTS language training materials, word and with part of speech tagging. The nature of the document is not a source.
windows_c_32
- 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45 ,API不超过2
ICTCLAS_JAVA
- 使用汉语分词系统ICTCLAS_JAVA版本进行中文分词、词性标注-Use of Chinese word segmentation system ICTCLAS_JAVA version of Chinese word segmentation, POS tagging
Miniseg
- 用java实现的一个小型分词程序,可以将词语分隔开来,但缺乏标注,如:他 喜欢 吃 苹果 。-Achieved with a small java program segmentation, words can be separated, but the lack of marking, such as: He likes to eat apples.
ictclas4j
- 本代码用java实现了分词功能,包括分词和词性标注,里面有具体的说明文档,包括数据结构的设计,分词步骤,分词系统研究等。-The code is implemented using java segmentation features, including word segmentation and POS tagging, which have specific documentation, including data structure design, word steps, such a
ICTCLAS
- 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009。-Institute of Computing Technology, Chinese Academy of resear
ICTCLAS50_Windows_32_JNI
- 中科院开发的中文分词算法,带词性标注等,经典的一个算法-Chinese Academy of Sciences of the Chinese word segmentation algorithm developed, with part of speech tagging, etc., a classic algorithm
Chinese-Lexical-Analysis
- 一种基于层叠隐马模型的汉语词法分析方法,旨在将汉语分词、词性标注、切分排歧和未登录词识别集成到一个完整的理论框架中.-An approach for Chinese 1exical analysis using cascaded hidden Markav model, which aims to incorporate segmentation, part-of-speech tagging, disambiguation and unknown words recognition int
_gparser
- 自然语言描述和处理的vs2008,包括分词,词性标注等-Natrual language processing, parse word, word meaning etc.
ICTCLAS50_Windows_32_C
- 中科院分析系统 ICTCLAS的主要功能有:中文分词;词性标注;命名实体识别;新闻识别;用户词典-ICTCLAS segementword
Rkeyword-choue
- 基于逆向最大匹配算法的分词及基于HMM模型的词性标注系统,包括了未登登录词的识别、数据库的添加等内容。(需要手动修改数据库的路径才可以运行) -Based on the segmentation of the reverse maximum matching algorithm and the HMM-based POS tagging system, including unadvertised login word recognition, and add the database co